Jina AI 集成接口指南

概述

本文档介绍 A1 平台与 Jina AI 集成的相关接口函数及参数定义。Jina AI 提供网页内容提取、搜索和文本分割等功能，适用于构建智能数据处理和检索系统。

一、jina_ai_read

功能说明

通过 Jina AI Reader API 从指定 URL 提取结构化的网页内容。适用于需要将网页转换为 LLM 友好格式的场景，如内容采集、知识库构建等。

输入参数

参数名	类型	必填	说明
`api_key`	String	*	Jina AI API 的认证密钥
`url`	String	*	需要解析的目标网页地址

输出参数

参数名	类型	说明
`title`	String	网页标题
`description`	String	页面描述信息
`url`	String	解析的原始 URL
`content`	String	提取后的网页内容（Markdown 格式）
`metadata`	Object	包含页面元信息的对象
`result`	Object	包含外部资源或扩展信息的对象

二、jina_ai_search

功能说明

通过 Jina AI Search API 执行智能搜索并返回结构化结果。适用于需要获取高质量搜索结果的场景，如问答系统、信息检索等。

输入参数

参数名	类型	必填	说明
`api_key`	String	*	Jina AI API 的认证密钥
`question`	String	*	需要搜索的问题或关键词
`country`	String	-	搜索的目标国家/地区（如 US、CN）
`language`	String	-	搜索的语言（如 en 表示英语、zh 表示中文）

输出参数

参数名	类型	说明
`title`	String[]	搜索结果中每个条目的标题数组
`url`	String[]	搜索结果中每个条目的链接数组
`description`	String[]	搜索结果中每个条目的描述数组

三、jina_ai_split

功能说明

通过 Jina AI Split API 将大段文本内容（如 Markdown、HTML 或纯文本）拆分成更小的块（chunks）。适用于需要将长文本分块进行进一步处理或分析的场景，如 RAG 系统、文档索引等。

输入参数

参数名	类型	必填	说明
`api_key`	String	*	Jina AI API 的认证密钥
`content`	String	*	需要被分割的原始文本内容
`return_tokens`	Boolean	-	是否在响应中包含 tokens 信息
`return_chunks`	Boolean	-	是否在响应中包含 chunks 内容
`max_chunk_length`	Integer	-	每个 chunk 的最大长度，默认为系统设定值

输出参数

参数名	类型	说明
`chunk_positions`	Number[]	每个 chunk 在原始内容中的起始位置数组
`tokens`	Array	如果启用 return_tokens，则包含 token 数组
`chunks`	String[]	如果启用 return_chunks，则包含 chunk 字符串数组

四、使用示例

4.1 网页内容提取流程

4.2 智能搜索流程

4.3 文本分割流程

4.4 完整业务场景

五、注意事项

项目	说明
API 密钥	api_key 需在 Jina AI 官网申请
请求限制	免费版有请求次数限制，建议合理控制请求频率
URL 格式	输入的 URL 需要包含协议（如 https://）
文本长度	jina_ai_split 对超长文本可能有处理限制，建议分段处理
错误处理	建议对接口返回结果进行异常捕获和处理

如需更多帮助，请参考 Jina AI 官方文档或联系技术支持。

概述​

一、jina_ai_read​

功能说明​

输入参数​

输出参数​

二、jina_ai_search​

功能说明​

输入参数​

输出参数​

三、jina_ai_split​

功能说明​

输入参数​

输出参数​

四、使用示例​

4.1 网页内容提取流程​

4.2 智能搜索流程​

4.3 文本分割流程​

4.4 完整业务场景​

五、注意事项​

概述

一、jina_ai_read

功能说明

输入参数

输出参数

二、jina_ai_search

功能说明

输入参数

输出参数

三、jina_ai_split

功能说明

输入参数

输出参数

四、使用示例

4.1 网页内容提取流程

4.2 智能搜索流程

4.3 文本分割流程

4.4 完整业务场景

五、注意事项